尽管机器人学课程在高等教育方面已建立,但这些课程通常专注于理论,有时缺乏对开发,部署和将软件应用于真实硬件的技术的系统覆盖。此外,大多数用于机器人教学的硬件平台是针对中学水平的年轻学生的低级玩具。为了解决这一差距,开发了一个自动驾驶汽车硬件平台,称为第1 f1 f1tth,用于教授自动驾驶系统。本文介绍了以“赛车”和替换考试的竞赛为主题的各种教育水平教学模块和软件堆栈。第1辆车提供了一个模块化硬件平台及其相关软件,用于教授自动驾驶算法的基础知识。从基本的反应方法到高级计划算法,教学模块通过使用第1辆车的自动驾驶来增强学生的计算思维。第1辆汽车填补了研究平台和低端玩具车之间的空白,并提供了学习自主系统中主题的动手经验。多年的四所大学为他们的学期本科和研究生课程采用了教学模块。学生反馈用于分析第1个平台的有效性。超过80%的学生强烈同意,硬件平台和模块大大激发了他们的学习,而超过70%的学生强烈同意,硬件增强了他们对学科的理解。调查结果表明,超过80%的学生强烈同意竞争激励他们参加课程。
translated by 谷歌翻译
自主赛车的主要挑战之一是在复杂的赛车课程中设计用于运动计划的算法。先前已经提出了端到端轨迹合成,其中根据赛车的摄像头图像计算自我车辆的轨迹。这是在使用行为克隆技术的监督学习设置中完成的。在本文中,我们通过引入差异贝叶斯过滤(DBF)来解决轨迹合成行为克隆方法的局限性,该贝叶斯过滤(DBF)使用概率B \'ezier曲线作为推断基于贝叶斯推论的最佳自主赛车轨迹的基础。我们引入了轨迹采样机构,并将其与过滤过程相结合,该过程能够将汽车推向其物理驾驶极限。 DBF的性能在深度序列的一级模拟环境中进行了评估,并将其与其他几种轨迹合成方法以及人类驾驶性能进行了比较。 DBF通过将赛车推到其控制范围的同时,同时始终保持在轨道范围内,从而达到了最快的圈时间和最快的速度。
translated by 谷歌翻译
本文介绍了一个自适应寻道纯追踪横向控制器,用于优化赛车度量,如圈时间,平均圈速度,以及从自主赛车场景中的参考轨迹的偏离。我们提出了一种贪婪的算法来计算和为每个航空点计算和分配用于改进种族度量的参考轨迹的纯Puppuit控制器的最佳保护距。我们使用基于ROS的自主赛车模拟器来评估自适应纯追踪算法,并将我们的方法与其他基于纯粹的横向控制器进行比较。我们还在使用F1 / 10自动raceCar上展示了我们在缩放实际测试的方法上。我们的方法导致自动racecar的赛车指标中的重大改善(20%)。
translated by 谷歌翻译
We present X-Decoder, a generalized decoding model that can predict pixel-level segmentation and language tokens seamlessly. X-Decodert takes as input two types of queries: (i) generic non-semantic queries and (ii) semantic queries induced from text inputs, to decode different pixel-level and token-level outputs in the same semantic space. With such a novel design, X-Decoder is the first work that provides a unified way to support all types of image segmentation and a variety of vision-language (VL) tasks. Further, our design enables seamless interactions across tasks at different granularities and brings mutual benefits by learning a common and rich pixel-level visual-semantic understanding space, without any pseudo-labeling. After pretraining on a mixed set of a limited amount of segmentation data and millions of image-text pairs, X-Decoder exhibits strong transferability to a wide range of downstream tasks in both zero-shot and finetuning settings. Notably, it achieves (1) state-of-the-art results on open-vocabulary segmentation and referring segmentation on eight datasets; (2) better or competitive finetuned performance to other generalist and specialist models on segmentation and VL tasks; and (3) flexibility for efficient finetuning and novel task composition (e.g., referring captioning and image editing). Code, demo, video, and visualization are available at https://x-decoder-vl.github.io.
translated by 谷歌翻译
分析大型随机矩阵的浓度是多种领域的常见任务。给定独立的随机变量,许多工具可用于分析随机矩阵,其条目在变量中是线性的,例如基质 - 伯恩斯坦不平等。但是,在许多应用中,我们需要分析其条目是变量中多项式的随机矩阵。这些自然出现在光谱算法的分析中,例如霍普金斯等人。 [Stoc 2016],Moitra-Wein [Stoc 2019];并根据正方形层次结构的总和(例如Barak等。 [FOCS 2016],Jones等。 [焦点2021]。在这项工作中,我们基于Paulin-Mackey-Tropp(概率Annals of Poylibity of Poyliby of 2016],我们提出了一个通用框架来获得此类界限。 Efron-Stein不等式通过另一个简单(但仍然是随机)矩阵的范围来界定随机矩阵的规范,我们将其视为通过“区分”起始矩阵而引起的。通过递归区分,我们的框架减少了分析更简单的矩阵的主要任务。对于Rademacher变量,这些简单的矩阵实际上是确定性的,因此,分析它们要容易得多。对于一般的非拉多巴纳变量,任务减少到标量浓度,这要容易得多。此外,在多项式矩阵的设置中,我们的结果推广了Paulin-Mackey-Tropp的工作。使用我们的基本框架,我们在文献中恢复了简单的“张量网络”和“密集图矩阵”的已知界限。使用我们的一般框架,我们得出了“稀疏图矩阵”的边界,琼斯等人最近才获得。 [焦点2021]使用痕量功率方法的非平地应用,并且是其工作中的核心组成部分。我们希望我们的框架对涉及非线性随机矩阵浓度现象的其他应用有帮助。
translated by 谷歌翻译
培训计算机视觉模型通常需要在各种场景配置和属性集中收集和标记大量图像。这个过程非常耗时,并且要确保捕获的数据分布映射到应用程序方案的目标域,这是一项挑战。最近,综合数据已成为解决这两个问题的一种方式。但是,现有方法要么要求人类专家手动调整每个场景属性,要么使用几乎无法控制的自动方法;这需要渲染大量的随机数据变化,这很慢,对于目标域通常是次优的。我们介绍了第一个完全可区分的合成数据管道,该数据管道使用具有目标应用程序损耗函数的闭环中的神经辐射场(NERF)。我们的方法可以在没有人工的情况下生成数据,以最大程度地提高目标任务的准确性。我们说明了我们方法对合成和现实对象检测任务的有效性。我们还引入了一个新的“ YCB野外”数据集和基准标准,该数据集和基准为对象检测提供了一种在现实世界环境中具有多种姿势的测试方案。
translated by 谷歌翻译
在线仇恨言论的扩散需要创建可以检测毒性的算法。过去的大多数研究都集中在这一发现作为分类任务上,但是分配绝对毒性标签通常很棘手。因此,过去很少有作品将相同的任务转变为回归。本文显示了拼图的最近发布的毒性严重性测量数据集上对不同变压器和传统机器学习模型的比较评估。我们进一步使用解释性分析来证明模型预测的问题。
translated by 谷歌翻译
The potential for complex systems to exhibit tipping points in which an equilibrium state undergoes a sudden and often irreversible shift is well established, but prediction of these events using standard forecast modeling techniques is quite difficult. This has led to the development of an alternative suite of methods that seek to identify signatures of critical phenomena in data, which are expected to occur in advance of many classes of dynamical bifurcation. Crucially, the manifestations of these critical phenomena are generic across a variety of systems, meaning that data-intensive deep learning methods can be trained on (abundant) synthetic data and plausibly prove effective when transferred to (more limited) empirical data sets. This paper provides a proof of concept for this approach as applied to lattice phase transitions: a deep neural network trained exclusively on 2D Ising model phase transitions is tested on a number of real and simulated climate systems with considerable success. Its accuracy frequently surpasses that of conventional statistical indicators, with performance shown to be consistently improved by the inclusion of spatial indicators. Tools such as this may offer valuable insight into climate tipping events, as remote sensing measurements provide increasingly abundant data on complex geospatially-resolved Earth systems.
translated by 谷歌翻译
良好的数据可视化不仅是无失真的数据图形表示,而且是一种揭示数据统计特性的方法。尽管在数据分析的各个阶段常用,但选择良好的可视化通常是涉及许多迭代的手动过程。最近,兴趣通过开发可以推荐可视化的模型来减少这项努力,但它们的使用量有限,因为它们需要大型培训样本(数据和可视化对)并主要关注设计方面,而不是评估效果选择可视化。在本文中,我们呈现Vizai,一种生成鉴别框架,首先从数据的多个替代可视化生成数据的各种统计特性。它链接到一个辨别模型,该模型选择最佳匹配被可视化数据的真实统计数据。 Vizai可以很容易地培训,可轻松监督,并适应具有不同程度的监督的设置。我们展示了Vizai的众所可求的判断和大型公开可视化的储存库,优于学习推荐可视化的现有方法的状态。
translated by 谷歌翻译